距离上次更新已经 1499 天了,文章内容可能已经过时。

课程主页:https://ocw.mit.edu/courses/mathematics/18-065-matrix-methods-in-data-analysis-signal-processing-and-machine-learning-spring-2018/index.htm

之前在Gilbert Strang教授的主页上注意到新课Matrix Methods in Data Analysis, Signal Processing, and Machine Learning,上周终于上线了,最近计划暑假前把这门课刷完,记录一些笔记和习题解析。

这一讲的主题是The Column Space of A Contains All Vectors Ax

例1

首先回顾Ax的解释,其中A是矩阵,x是向量,考虑如下例子:

Ax=[2133145712][x1x2x3]

一种理解为内积的理解,即

Ax=[2x1+x2+3x33x1+x2+4x35x1+7x2+12x3]

另一种理解为列向量的线性组合,即

Ax=x1[235]+x2[117]+x3[3412]

注意A的秩为2,所以Ax表示平面。

对于一般的情形,我们有

Ax=AC(A)

例2

再来看一个例子:

A=[138138138]=[111][138]=uvT

显然

rank(A)=1=#线

所以

C(A)=线

例3

考虑如下例子:

A=[213314527]=[213152][101011]CR

其中C的含义为column,由为C的列的基向量;R的含义是row,表示基向量组对应的系数,特别的,我们有

[213152][10]=[235]=a1

实际上R也为A的行的基向量,所以该分解说明了A的行秩等于列秩。

AB的理解

假设ARm×n,BRn×p,对于矩阵乘法AB,有两种理解,第一种理解为A的行向量和B的列向量做内积:

AB=[a~1Ta~mT][b1b2bp]=[a~iTbj]m×p

这种方式的计算量为

n×m×p=mnp

另一种理解为A的列向量和B的行向量相乘:

AB=[a1a2an][b~1Tb~nT]=i=1naib~iT

这种方式的计算量为

n×mp=mnp

可以看到这两种方式的计算量相同。

习题

1

考虑如下例子

a1=[1000],a2=[0100],a3=[1100]

那么

a1+a2a3=0

向量形式为

A=[a1a2a3],x=[111],Ax=0

其中

AR4×3,xR3,0R4

4

不难看出可以取

x=[101],y=[011]

其中

Ax=[111][111]=[000]

注意到

rank(A)=1

所以Ax=0只有两个线性无关的解,因此老师没有让我们找第三个线性无关的向量z,使得Az=0

9

设矩阵为A,因为A的列空间是R3,所以m=3,并且

r=rank(A)=3

所以显然有

n3

18

A=CR可得[0A0A]对应的C=[CC],所以

[0A0A]=[CC][0R]